检索结果

Select

1. 一种基于Tree-LSTM的句子相似度计算方法

杨萌, 李培峰, 朱巧明

北京大学学报（自然科学版） 2018, 54 (3): 481-486. DOI: 10.13209/j.0479-8023.2017.169

摘要（1145）

HTML （10）

PDF（pc）（458KB）（233）

在浅层句法树和依存关系树的基础上, 提出两种结构化特征: 基于短语的浅层句法树NPST和基于短语的依存树NPDT, 并将它们与Tree-LSTM模型相结合, 进行句子相似度计算。实验表明, 使用结构化特征和Tree-LSTM会带来性能的提升。

相关文章 | 多维度评价 | 评论（0）

Select

2. 基于全局优化的中文事件同指消解方法

滕佳月, 李培峰, 朱巧明

北京大学学报（自然科学版） 2016, 52 (1): 97-103. DOI: 10.13209/j.0479-8023.2016.010

摘要（1103）

HTML

PDF（pc）（494KB）（932）

针对目前对事件同指关系的研究中多采用事件对分类或聚类方法而忽略事件相互之间内在联系的问题, 提出一个中文事件同指消解的全局优化模型, 用于减少因分类器错误造成的同指事件链不一致问题。该模型利用对称性、传递性、触发词、论元角色、事件距离等多种约束条件, 将同指消解转化成整数线性规划问题。实验结果表明, 与分类器方法相比, 全局优化模型的F1值提高4.20%。

相关文章 | 多维度评价 | 评论（0）

Select

3. 基于MLN的中文事件触发词推理方法

朱少华, 李培峰, 朱巧明

北京大学学报（自然科学版） 2016, 52 (1): 89-96. DOI: 10.13209/j.0479-8023.2016.012

摘要（1073）

HTML

PDF（pc）（867KB）（1223）

现有的中文事件触发词抽取方法大多数采用特征工程和触发词扩展方法, 无法利用同一文档中各个触发词实例之间的内在关系。为了解决上述问题, 基于马尔科夫逻辑网络(MLN), 利用核心词素, 训练语料中触发词实例填充真假事件的概率, 以及触发词实例间的关系等信息来推导测试集中缺乏有效上下文信息和低可信度的触发词实例。在ACE 2005 中文语料上的实验结果表明, 与基准系统相比, 该方法在触发词识别和事件类型分类阶段F1值分别提高3.65%和2.51%。

相关文章 | 多维度评价 | 评论（0）